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摘 要 : 针对 射电 天 文 观测 过 程 中 的 射频 干扰 (RF1) 问题 ， 详 细 分 析 了 国内 外 台 站 RFI 


抑制 策略 。 根 据 各 天 文 台 站 实际 观测 过 程 中 遇 到 的 REL 问题 ， 分 别 从 主动 预防 阶段 、 预 相关 
阶段 、 后 相关 阶段 、 机 器 学习 和 深度 学 习 等 方面 研究 了 RF1 的 预防 策略 和 抑制 方法 。 详细 分 
析 了 主动 预防 阶段 可 采取 的 方法 ， 预 相关 阶段 的 自 适应 滤波 ， 和 空间 滤波 方法 ; 后 相关 阶段 
的 VarThreshold, SumThreshold 和 奇异 值 分 解 等 方法 。 探 讨 了 基于 机 器 学 习 的 主 成 分 分 析 、 
支持 向 量 机 、 全 卷 积 神经 网 络 、 卷 积 神经 网 络 、U-Net 等 相关 技术 和 方法 在 RF1 信号 处 理 方 
面 的 应 用 。 

关键 词 : RFI; 滤波 ; BA, MBP; 

中 图 分 类 号 : P161 文献 标识 码 : 文章 编号 : 


了 中 


1 引 


射电 天 文学 中 ，REFI 被 定义 为 任何 可 能 影响 天 文 观测 的 有 害 信 号 ， 射 电 天 文学 发 展 过 
程 中 ， 抑 制 RFI 一 直 是 天 文学 家 研究 的 热点 。 随 着 信息 技术 飞速 发 展 ， 人 为 造成 的 干扰 信 
号 导致 天 文 台 站 周围 电磁 环境 恶化 ， 影 响 射 电 望 远 镜 正 常 观测 。 

RFI 的 来 源 多 种 多 样 , 包括 外 部 来 源 和 内 部 来 源 , 外 部 来 源 主 要 由 天 文 台 址 外 设备 产生 ， 
an Ade EB" (北斗 和 GPS 导航 卫星 等 )、 飞 机 、 台 址 附近 的 基站 信号 以 及 电视 广播 号 等 ; 内 


日 天文台 址 内 使 用 的 电子 设备 产生 ， 如 计算 机 、 视 频 监 控 、 网 络 交换 设备 、 无 线 


部 来 源 主要 


jami 


输入 设备 等 中 。 天 文 信号 通常 为 宽频 带 且 在 时 间 尺 度 上 平滑 变化 ， 而 RFI 在 时 域 和 频 域 的 幅 


值 强度 高 ， 绝 大 部 分 RFI 与 天 文 信号 相 比 有 明显 差异 中 。RFI 与 热 噪声 不 同 ， 它 通常 由 通信 
系统 、 人 造 雷达 或 电子 设备 产生 的 干扰 构成 ， 且 通常 具有 复杂 的 时 间 和 频率 结构 ,常见 通信 
言 号 的 功率 比 天 文 信号 高 多 个 数量 级 并 且 会 随时 间 变 化 ， 因 此 无 法 通过 长 时 间 积 分 (累积 》 
来 降低 其 强度 ， 严 重 影响 天 文 数 据 质 量 。 天 文学 家 针对 上 述 问题 已 提出 了 多 种 RED 抑制 方 
法 ， 但 仍 受 到 以 下 因素 制约 : 


xe 
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C1) 近年 来 ， 随 着 无 线 技术 的 飞速 发 展 及 人 类 活动 范围 的 扩大 ， 地 面 及 空间 产生 的 人 
为 干扰 逐年 递增 。 

C2) 随 着 制造 技术 和 信息 技术 的 飞速 发 展 ， 射 电 望 远 镜 向 大 口径 或 大 规模 阵列 方向 发 
展 ， 随 着 多 波束 或 PAF 接收 系统 的 投入 使 用 ， 使 得 观测 设备 的 灵敏 度 及 数据 收集 能 力 显著 
提升 ， 同 时 RFI 抑制 问题 更 加 复杂 。 

在 射电 天 文 观测 以 及 数据 处 理 过 程 中 需要 针对 不 同 阶段 采取 不 同 的 RL 应 对 策略 ， 本 
文 将 REL 抑制 策略 分 为 主动 预防 阶段 、 预 相关 阶段 及 后 相关 阶段 ， 不 同 阶段 针对 RFI 问题 
可 采取 不 同 抑制 方法 。 主 动 预防 阶段 若 能 采取 有 效 防护 手段 ， 能 够 杜绝 通信 基站 ， 电 视 广 描 
等 大 部 分 RFI 进入 系统 ; 预 相关 阶段 采取 参考 天 线 及 空间 滤波 等 方法 可 以 应 对 特定 RFI 源 ; 
后 相关 阶段 中 可 以 采取 阔 值 法 处 理 幅 值 强 度 远 大 于 天 文 信号 REL, 或 利用 机 器 学 习 相 关 技 术 
实现 RFI 数据 标记 。 下 面 针 对 不 同 阶段 可 采取 的 RFI 抑制 策略 进行 详细 分 析 : 

2 RFI 主动 预防 阶段 


2.1 电磁 波 宁静 区 


射电 望远镜 观测 的 是 来 自 宇宙 遥远 天 体 的 微弱 信号 ,对 人 台 址 周边 电磁 干扰 有 较 高 要 求 ， 
选择 地 理 环 境 较 好 的 台 址 及 建立 无 线 电 宁静 保护 区 是 抑制 REL 的 重要 一 步 ， 可 以 从 根源 上 


去 除 大 部 分 干扰 。 500m 口径 球面 射电 望远镜 (Five-hundred-meter Aperture Spherical radio 


= Telescope，FAST)， 是 世界 最 大 单口 径 、 最 灵敏 的 射电 望远镜 ， 位 于 贵州 省 黔 南 布依 族 苗 族 
Aa AP oR REA Bk, U FAST 台 址 为 中 心 ， 建 立 半 径 为 30km 的 FAST 电磁 波 
于 静 区 ， 分 为 不 同 要 求 的 3 个 区 域 。 其 中 以 台 址 为 圆心 ， 半 径 5km 范围 为 保护 核心 区 ， 
5~10km 的 环 带 为 中 间 区 ，10~30km 的 环 带 为 边远 区 叫 ， 如 图 1 所 示 ， 能 够 屏蔽 绝 大 部 分 外 
来 干扰 源 。 
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图 1 FAST 无 线 电 宁 静 保 护 区 (来 源 文 
Fig.1 FAST Radio Quiet Zon 


献 [25]) 
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有 望远镜 (Qi Tai Radio Telescope, QTT) 中 ， 位 于 新 疆 昌 吉州 


奇 台 县 ， 以 QTT 台 址 为 中 心 ， 依 据 QTT 地 形 特 征 及 当地 实际 情况 , 规划 了 30 km 的 无 线 电 


于 前 


kmx4 km 的 矩形 区 域 ， 限 


2.2 预 留 频段 


区 ， 该 宁静 


区 共 分 为 三 个 区 域 ， 分 别 为 核心 区 、 限 人 
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图 2 QTT 无 线 电 宁 静 保 护 区 (来 源 文 
Fig.2 QTTRadio Quiet Zone 


HD. Hyi K. 


El] XE 10 kmx15 km (FEB KRE, HK 


献 [6]) 
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中 核心 区 域 为 2.5 


2 所 示 。 


国际 电信 联盟 ITU) 通过 划分 频谱 来 协调 8.3 MHz-300 GHz 之 间 的 无 线 电 频谱 ， 将 
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对 应 于 射电 天 文学 (确切 的 数量 取决 于 


分 为 几 个 频带 ， 仅 允许 指定 服务 运行 。 在 分 配 的 所 有 频段 之 间 ， 约 有 70 到 80 个 频段 


地 区 和 当地 法 律 ) 。 针 对 射电 天 文 频段 ， 一 种 是 射电 


天 文 专用 频段 (或 与 无 源 服务 共享 ) ， 严 格 禁止 无 线 电 发 射 ; 另 一 种 是 与 有 源 业 务 共享 的 频 


段 ， 只 能 部 分 施加 保护 。 射 电 天 文 的 波 


段 选择 通常 与 科学 目标 有 关 。 例 如， 氧 线 (由 于 中 性 


所 原子 状态 的 改变 而 发 射 ) 位 于 1420 MHz 附近 ， 因 此 1400-1427MHz 频带 保留 给 射电 天 


ve 2, 
LF o 


即使 导电 天 文 专用 频段 ， 由 于 有 源 元 件 的 谐 波 和 功率 泄漏 ， 仍 然 可 能 存在 干扰 。 对 于 
这 些 情况 , ITU 在 其 ITU-R RA.769 建议 报告 中 , 将 最 大 可 接受 的 干扰 定义 为 在 测量 功率 中 


引入 不 超 10% 的 误差 ， 这 是 天 文学 家 普遍 接受 的 阔 值 ， 该 报告 还 为 一 些 典 型 的 天 文 波段 提 
供 了 一 份 使 用 普通 望远镜 和 观测 参数 的 建议 阔 值 清单 。 


2.3 RFI 主动 预防 策略 的 不 足 


RFI 主动 预防 策略 中 最 直接 的 方法 是 为 天 文 台 选择 远离 干扰 源 的 偏远 位 置 。 自 然 形态 


《例如 山脉 ) 可 以 有 效 地 阻止 外 部 干扰 


， 但 干扰 源 会 因为 多 径 传播 产生 反射 和 衍射 ， 从 而 增 


加 干扰 抑制 难度 。 一 些 观 测 站 研究 发 现 ， 在 望远镜 台 址 周围 种 植 松 树 等 针叶树 可 有 效 抑 于 


= 


RFI， 树 针 中 的 水 分 可 吸收 1GHz 以 上 的 信号 *。 部 分 天 文 台 站 建 在 高 海拔 地 区 以 减少 大 气 


对 观测 的 影响 且 远 离 人 类 活动 范围 , 同 
的 办 法 是 在 产生 干扰 的 电子 设备 (计生 


时 尽 可 能 避免 干扰 源 多 径 传播 。 面 对 内 部 干扰 ， 通 常 
机 、 微 波 和 射频 元 件 ) 上 履 盖 电磁 屏蔽 材料 ， 比 如 时 


m 


外 稍 ， 也 可 以 将 电子 设备 集中 放 入 屏蔽 室 ， 将 干扰 控制 在 密闭 空间 ， 并 不 影响 设备 性 能 。 
通常 ， 主 动 预 防 是 处 理 干 扰 的 最 有 效 方法 ， 可 作为 RFI 的 第 一 层 防 护 。 但 仍然 存在 不 


| 


(1) 只 能 为 


m 


EREITEA ABA EN 


保护 。 


(2) 对 于 高 灵敏 度 的 设备 ， 电 磁 屏 蔽 材料 并 不 能 完全 屏蔽 干扰 。 
(3) 卫星 通信 以 及 飞机 等 产生 的 干扰 ， 由 于 相对 位 置 限制 ， 无 法 通过 主动 预防 的 方法 


避免 。 


! http://www.fcc. gov/oet/spectrum/table/fectable 


.pdf 


? https://www.itu.int/dms_pubrec/itu-r/rec/ra/R-REC-RA. 1860-0-201001-I!!PDF-E.pdf 
3 https://www.itu.int/dms_pubrec/itu-r/rec/ra/R-REC-RA.769-2-200305-I!!PDF-C.pdf 
4 https://www.itu.int/dms_pub/itu-r/opb/rep/R-REP-RA.2259-2012-PDF-E.pdf 
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3 RFI 预 相 关 阶 段 


本 文 将 观测 获取 的 原始 数据 在 未 写 入 磁盘 形成 可 供 科 学 研究 处 理 之 前 的 RFI 处 理 阶段 
定义 为 预 相关 阶段 。 对 于 单 天 线 观 测 可 利用 参考 天 线 通过 自 适 应 滤波 方式 去 除 特定 干扰 , 对 
于 阵列 天 线 可 采用 空间 滤波 方法 抑制 RFI。 


3.1 自 适应 滤波 


自 适 应 滤波 算法 是 由 Barnbaum 和 Bradley 在 1998 年 首次 引入 射电 天 文 领域 用 来 解决 
RFI 问题 时 ， 在 2005 年 ，Kesteven 等 人 进行 了 现场 试验 ， 在 REIL 存在 的 情况 下 ， 自 适应 滤 


波 方式 能 够 极 大 改善 脉冲 星 观测 中 。 


| Filtered signal 


RFI reference ante, 


区 


CD 


自 适应 滤波 器 基本 设计 图 


Fig.3 Adaptive filter basic design diagram 


参考 天 线 接收 的 信号 可 表示 为 : 


R = Rnoise + Fi + Rast#(1) 


其 中 R 表 示 参 考 天 线 接收 的 信号 ，Rioise 表 示 参 考 天 线 的 系统 噪声 ，R,pi 表 示 参 考 天 线 
接收 的 RFI，Rast 表 示 参 考 天 线 接收 到 的 天 文 信号 ， 天 文 信号 通过 参考 天 线 的 旁 闪 接收 ， 其 
强度 微弱 可 忽略 不 计 。 同 理 ， 主 望远镜 接收 的 信号 可 表示 为 : 

M = Mnoise + Mri + Mase#(2) 

主 望 远 镜 和 参考 天 线 接 收 的 系统 噪声 不 相关 ， 而 接收 的 RFI 具有 相关 性 。 为 了 消除 主 
天 线 中 的 REFI， 使 其 对 准 RF 源 ， 并 通过 不 断 优 化 参考 天 线 的 指向 及 极 化 方向 可 提高 参考 天 
线 中 RFI 信 噪 比 。 


自 适应 滤波 具体 实现 步骤: 


(1) 在 自 适应 相关 环 路 中 确定 复 增益 系数 9〈 该 系数 是 不 断 迭 代 优化 的 ) 与 参考 天 线 接 
WH SRIF, BARING - Rp;， 使 其 大 小 接近 主 天 线 的 RFI 信号 ， 能 最 大 程 
度 消除 主 天 线 录 一 特定 方向 的 RFI。 

(2) 当 g 达 到 最 优 值 时 ，g - Rypi 基 本 接近 My;， 天 文 信号 与 参考 信号 的 差 值 即 为 去 除 特 
定 干扰 后 的 天 文 信号 

(3) 图 3 为 自 适 应 滤波 器 基本 设计 图 ， 将 原始 参考 信号 与 滤波 器 输出 相关 ， 当 相关 系 
数 为 零 时 ， 达 到 最 佳 增益 。 

相关 项 计算 如 公式 (3) 所 示 ， 

C(g) = (M—g- R): R#G) 


当 C(g) = 0 时 ， 可 剔除 主 天 线 的 REFI， 即 


M 
0=M-g:R=>M=g:R>g=7#4) 


代入 天 线 接收 的 各 个 分 量 得 : 
_ Mnoise + Mrpi + Mastr 
~~ Rnoise + Rrpi + Rastr 
(Mnoise + Mrpi + Mastr) ` (Rnoise + Rrpi + Rastr) #(5) 
(Rnoise + Rypi + Rastr) * (Rnoise + Rrfi + Rastr) 


因为 两 个 天 线 的 系统 噪声 、 天 文 信号 、 其 他 信号 均 与 RFI 不 相关 ， 参 考 天 线 中 的 天 文 
音 号 非常 微弱 ， 可 以 忽略 不 计 ， 即 Ru, = 0， 那 么 上 式 进 一 步 简化 得 ; 


MMR 
g= ey 
Rinoise 十 Rrpi 
& My pi = ERr gir 9 可 以 写 为 : 
Š 
= 一 一 一 一 一 #(7 
8= Tyne? 
其 中 INR(Interference-to-Noise Ratio) 是 参考 天 线 中 的 干扰 噪声 比 RrpilRaoise? "I 


以 明显 看 出 ， 当 INR 越 大 ，9 值 越 小 ， 自 适应 滤波 器 效果 越 好 。 和 输出 信号 中 RFI 的 残留 量 为 


Srfi = Mrfi— 9° Rrpi 


5 
= Mrpi — Tri 

INR 
Myfi + Mypi INR — SINR © Regi 
7 1+INR 


Mrpi 
-RA INR: Re 


1+INR 


Mrpi + Mrpi: INR 


__Mrfi 
1+INR 


在 天 文 观测 中 , 主 天 线 指向 待 观 测 的 天 体 ， Mrri 在 观测 期 间 可 以 认为 是 恒定 量 ，Srri 与 
INR 成 反比 ， 即 INR 越 大 ，5%ji 越 小 ， 说 明 提 高 RFI 在 参考 天 线 中 信 品 比 能 提高 主 天 线 RFI 
抑制 能 力 。 

影响 自 适应 滤波 性 能 的 几 个 因素 : 


(1) 混合 RFI W 


#(8) 


自 适 应 滤波 方法 消除 单 源 RFI 效果 较 好 ， 但 是 面 对 复 杂 的 RFI 环境 ， 其 抑制 RFI 的 性 能 
会 大 幅度 下 降 。 对 于 混合 RFI， 当 两 个 干扰 信号 处 于 相同 频 域 时 ， 振 幅 大 的 干扰 将 被 消减 。 
对 于 天 文 台 址 附近 RFI 来 源 复杂 ， 且 与 天 文 信号 相 比 具有 较 高 的 功率 ， 在 此 类 条 件 下 自 适 
应 滤波 方法 RFI 抑制 效果 一 般 ("。 

(2) 多 路 径 传播 影响 

多 径 传 播 是 指 由 于 信号 到 达 接 收 天 线 的 路 径 不 同 ， 而 存在 同一 信号 的 多 个 副本 的 现象 ， 
通常 是 由 大 型 陆地 物体 (山脉 、 建 筑 物 )、 大 型 水 体 (湖泊 、 海 湖 ) 和 电离 层 反 射 产 生 的 。 


In + delay; 


ad 
ee 


Rn + delay 


图 4 RFI 多 径 传播 情况 


Fig.4 RFI multipath propagation situation 
图 4 描述 了 多 路 径 干扰 信号 传播 场景 。 因 为 到 达 望 远 镜 和 参考 天 线 的 多 个 副本 有 不 同 的 
时 间 延 迟 。 如 果 延 迟 足 够 大 ， 那 么 添加 的 信号 就 可 以 被 望远镜 视 为 完全 不 相关 。 在 这 种 情况 
下 ， 多 路 径 情况 相当 于 多 个 RFI W, REI 信和 号 种 类 繁多 ， 难 以 获得 滤波 器 多 径 传播 的 通用 
表达 式 。 防止 多 径 传 播 的 最 佳 措施 是 将 望远镜 和 参考 天 线 放置 在 尽 可 能 近 的 位 置 , 以 减 小 传 
播 距离 差异 ， 并 通过 增加 FFT 点 数 来 提高 系统 的 频率 分 辨 率 ， 或 在 FFT 点 数 不 变 的 条 件 下 
> BBE 。 

(3) 违反 线性 时 不 变 (LTD 条 件 

假设 干扰 传播 路 径 至 少 在 滤波 器 收敛 的 时 间 内 满足 LTI 条 件 。 如 果 不 满 足 LTI 条 件 ， 
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则 表示 RFI 路 径 在 茶 些 地 方 呈现 非 线性 或 时 变 的 传播 特性 。 然 而 ， 疫 有 任何 自然 介质 表现 
出 足够 强 的 非 线性 ， 或 具有 快速 变化 的 传播 特性 ， 而 影响 滤波 器 的 性 能 ， 特 别 是 考虑 到 最 终 
算法 收敛 时 间 是 毫秒 级 的 。 当 望远镜 在 跟踪 天 体 移 动 时 ， 捕 获 RFI 的 旁 激 随 望 远 镜 一 起 移 
动 ， 被 测 REL 的 路 径 特性 会 随时 间 逐 渐变 化 。 自 适应 滤波 方法 需 具 备 相应 计算 能 力 ， 以 使 
其 不 会 因 望 远 镜 的 缓慢 移动 而 受到 明显 影响 。 

接收 机 前 端的 一 些 模 拟 元 件 是 信号 饱和 的 , 如 放大 器 和 频率 混 频 器 。 当 一 个 分 量 达到 饱 
和 时 ， 输 入 信号 的 幅 值 就 会 被 前 去 ， 从 而 产生 谐 波 失真 ， 将 会 影响 系统 的 LTI 条 件 。 这 种 
失真 被 视 为 附加 的 损坏 信号 ， 其 频率 是 原始 输入 信号 中 心 频率 的 几 倍 。 此外， 由 于 数字 化 后 
的 混 半 等 原因 ， 谐 波 信 号 往往 会 被 混入 基带 从 而 破坏 天 文 数据 。 主 信道 RFI 谐 波 失真 会 严 
重 破坏 滤波 器 性 能 , 附加 的 谐 波 信号 不 会 出 现在 参考 信道 中 , 使 得 这 类 RFI 更 难 被 抑制 1。 


3.2 空间 滤波 


空间 滤波 方法 主要 针对 多 通道 射电 天 文 观测 中 的 RFI 抑制 问题 0523， 该 技术 适用 于 干 
涉 射 电 望 远 镜 阵 列 , 如 荷兰 的 Westerbork 综合 射电 望远镜 (WSRT), 美国 的 甚大 阵列 (VLA)， 
或 配置 了 相 控 阵 接收 系统 的 单 天 线 望远镜 ,图 5 显示 了 空间 滤波 技术 在 天 线 阵 列 系统 中 的 应 
用 。 


RFI mitigation 
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图 5 天 线 阵列 系统 在 不 同 阶段 抑制 RFI 


Fig.5 Antenna array system suppresses RFI at different stages 
射电 望远镜 接收 的 信号 由 三 部 分 组 成 , 射电 源 信号 〈 拟 观测 目标 )、 系 统 噪声 以 及 RF 
系统 噪声 由 宇宙 背景 噪声 、 大 气 噪 声 、 接 收 机 噪声 等 噪声 分 量 组 成 。 根 据 中 心 极 限定 理 ， 系 


统 噪 声 是 时 间 独 立 的 且 高 斯 分 布 的 信号 , 在 短 时 间 间 隔 上 是 短 时 平稳 的 , 且 所 有 的 射电 源 都 


China wA de HBAIII 
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BREES EA 

射电 天 文学 中 的 RFI 特征 是 各 种 各 样 的 。 选 择 中 心 窗 带 高 斯 平稳 、 二 阶 非 周期 和 循环 
平稳 信号 三 种 不 同 的 信号 特性 来 建 模 RFI。 

天 线 阵列 共有 M 个 天 线 ， 其 中 x(b = [x1(t) …xw(D]r 表 示 的 是 M x 1 个 天 线 阵列 的 输出 ， 
5 中 第 K 个 天 线 在 时 间 t 时 刻 的 输出 为 xx(D， 那 么 x(9 可 以 被 写 为 


N 


x(t) = Ac: c(t) + Ar: r(t) + n(t)#(9) 


Hı 


(1) c(t) = [at ew, (6 表示 在 t 时 刻 时 ， 射 电源 的 特征 向 量 ， 大 小 为 Ne x 1。 


2) Ae = [ei(t Ber Per) = Cwe (t Bewos Pen, ) [LIA BIRR 2S FAVRE AL EERE, 大 小 为 M x Neo 


其 中 c(t Oc,» Pen) = [cn (t, Oc,» Pen) i Cn m(t, Oc,» 中 。 )] 是 第 n 个 身 电源 的 空间 特征 向 


pri 


sn 
al] 


司 理 ，A% 和 x(t) 分 别 代表 着 RFI 的 空间 特征 向 量 矩 阵 以 及 在 t 时 刻 RFI 的 信号 特征 
向 量 。 

(3) nt) = [mE nn O 是 系统 噪声 在 寺 刻 的 向 量 ， 大 小 为 M x 1。 

通过 协 方差 矩阵 描述 射电 源 在 时 间 维 度 上 的 相关 性 ， 即 


R(t,1) = Efx (t + =) x" (t- =)}#(10) 


> 其 中 R(t, 避 描述 在 t 时 刻 t 范 围 内 射电 源 信号 的 相关 性 , xR RhE. LBL RELL 
e 射电 源 和 系统 噪声 三 者 相互 独立 ， 即 互 不 相关 ， 那 么 


= E{cy (t + =) Grn (t — =)} =0, Vz,né[1...N,],meé [1...N;,] 


E{cy (t + =) Nin (t 一 =)} =0, Vz,neé[1..N,|,meé [1...M] 


Em (t + =) Nin (t 一 =)} =0, Vz,n€[1...N,],m E [1...M]#(11) 


从 线性 代数 的 观点 来 看 , 相 控 天 线 阵 列 射电 望远镜 数据 协 方差 矩阵 可 以 看 作 是 线性 变换 
矩阵。 这 个 矩阵 生成 一 个 数据 向 量 空间 ， 该 向 量 空 间 由 RFI 子 空间 、 射 电源 子 空 间 和 系统 
噪声 子 空 间 组 成 。 图 5 展示 了 一 个 无 噪声 场景 下 的 二 维 数 据 向 量 空间 的 示例 。 红 色 和 黑色 矢 
量 分 别 代表 与 射电 源 和 射频 干扰 源 相关 的 向 量 。 
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图 6 二 维 数据 向 量 空间 的 正 交 投影 


Fig.6 Orthogonal projection of a two-dimensional data vector space 
使 用 正 交 投影 技术 减少 干扰 ， 将 数据 向 量 空间 投影 到 与 REFI 子 空间 正 交 的 子 空间 上 ， 
投影 的 RFI 子 空间 完全 为 零 ， 由 此 产生 的 数据 只 包含 射电 源 。 

从 图 6 上 可 以 清楚 地 看 出 , 在 投影 后 , 恢复 的 射电 源 能 量 取 决 于 两 个 向 量 的 夹 角 大 小 ， 


即 


P2 = P? - sin (Baa, ) #(12) 
其 中 P? 代 表 着 射电 源 的 功率 , Og a, 代表 着 RFI 向 量 与 射电 源 向 量 的 夹 角 大 小 ,在 0~90? 
WAA, Garan, 越 大 ， 最 终 投影 得 到 的 射电 源 功 紊 越 大 。 但 是 射电 源 子 空间 和 干扰 子 空间 之 
间 的 夹 角 难以 测量 ， 需 要 借助 投影 第 阵 间 接 计 算 。 
设 投影 矩阵 为 P， 它 的 特征 值 是 0 或 1。 特 征 值 为 0 对 应 的 特征 向 量 生 成 投影 核子 
空间 ， 特 征 值 为 1 对 应 的 特征 向 量 生成 值 域 子 空间 。 因 此 投影 矩阵 的 秩 等 于 它 的 值 域 子 空 
间 的 维 数 。 如 果 H 是 投影 范围 子 空 间 基 , K 是 投影 核子 空间 基 ， 则 有 : 


P-H=H 


P-K = 0#(13) 
rH EREHE Be UBER EE SO 
P = H(H"H)"!H7#(14) 
FAIR IEE THANE EADIE EHP, GE SON: 
p+ = I — H(H™H)-1HT#(15) 
在 多 干扰 的 情况 下 ,干扰 子 空间 是 多 维 的 ， 这 个 子 空间 是 由 存储 在 矩阵 4 中 的 独立 RFI 
集合 生成 的 。 因 此 ， 投 影 矩 阵 可 表示 为 
P,* = I — A, (A7 Ar) 1AT#(16) 
在 预 相关 阶段 , 可 用 数据 为 天 线 阵列 输 出 数据 向 量 x(t), 将 其 投影 到 RFI 子 空间 的 正 交 
空间 上 ， 修 正 后 的 数据 向 量 xcyean(t) 为 


Xclean(b) = P.~x(t)#(17) 


xh 
H 


从 以 上 内 容 可 知 ， 空 间 滤 波 需 要 预先 知道 干扰 源 来 源 ， 以 便 确 定投 影 矩 阵 ， 对 于 复杂 的 
干扰 环境 ， 干 扰 源 具体 位 置 测 定 是 非常 困难 的 。 


4 RFI 后 相关 阶段 


由 于 RHI 信号 强度 通常 比 天 文 信号 大 几 个 数量 级 , 闵 值 法 是 一 种 有 效 抑制 RFI 的 方法 。 
六 值 水 平 通常 是 根据 统计 量 决定 的 ， 可 以 用 一 段 数据 的 均值 、 均 方 根 等 作为 闵 值 参考 值 ， 超 
出 这 个 范围 之 外 的 值 都 标记 为 RFI。 六 值 法 不 足 之 处 是 会 误 将 天 文 信号 标记 为 RFI， 在 后 相 
关 阶 段 降低 RFI 检测 的 错误 率 是 研究 RFI 抑制 问题 的 一 个 重要 方向 。 


4.1 VarThreshold 算法 


在 频 域 和 时 域 上 ，RFI 数据 往往 会 影响 相 邻 的 数据 ， 因 为 其 强度 比较 低 ， 往 往 不 会 被 标 
记 为 RFI， 增 加 了 检测 RFI 的 错误 率 。VarThreshold 是 一 种 组 合 闵 值 算法 ， 其 思想 是 当 组 合 
样本 的 某 一 统计 属性 超过 某 个 限制 时 ， 将 标记 样本 的 组 合 为 RFIW* I。 假设 4 和 B 是 相 邻 的 
样本 采样 点 ， 常 规 阔 值 法 是 分 别 查看 样本 4 和 是 否 超过 设 定 的 阔 值 水 平 线 ， 如 果 超 过 ， 则 
标记 为 RFI。 但 对 于 组 合 阐 值 来 说 ， 只 有 样本 4 和 8 都 超过 闵 值 ， 才 可 以 将 这 一 组 合 的 样本 
都 标记 为 RFI。 如 果 样 本 4 和 B 没 有 被 标记 为 RFI, 它们 将 和 下 一 个 相 邻 的 采样 点 C 进 行 组 合 ， 
ARC GARETT HE, WER RER RF 标记， 算法 如 公式 (18) 所 示 。 


flag vy(v,t) = 3ie{0,...M— 1}: Yj € {0, ...M — 1}: |R(v +aAv,t)| > xy #(18) 
上 式 表达 的 是 从 t 时 刻 起 , M 个 数 的 范围 内 , 如 果 该 范围 内 所 有 采样 点 的 绝对 值 大 于 Xm， 
那么 将 这 M 个 数 都 标记 为 RFI。 


VarThreshold 算法 用 一 组 严格 递减 的 浆 值 序列 Xi(i = 二 …,N) 判 定 某 个 采样 点 是 否 应 被 


标记 为 REFI， 如 公式 〈19) 所 示 。 


XI 
Xt = Sogn #19) 


FLAY, XE PORE EL, “4p = 1.5 时 效果 最 好 ,Xa 的 取 值 是 根据 数据 的 统计 水 平 量 决定 ， 
即 选 取 的 阔 值 使 REI 的 假 阳 率 最 小 。 
4.2 SumThreshold 算法 

SumThreshold 算法 也 是 一 种 组 合 闪 值 算法 岑 25， 与 VarThreshold 算法 求解 阔 值 序列 类 
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似 ， 只 是 p 值 不 同 ， 当 p = 1.2 时 效果 最 好 ， 求 出 一 组 阔 值 7 = {Tr Tz Th p ERA 
式 与 样本 进行 比较 ， 即 久 与 单 样本 比较 ,7 与 两 个 样本 的 均值 比较 ,Th 与 m 个 样本 的 均值 比 
较 ， 当 样本 均值 大 于 阔 值 时 ， 被 标记 为 REFI， 且 不 参与 后 续 的 迭代 计算 过 程 。 以 一 维 序列 为 


Gil, Be WAGL7,43,2,1,1,6,1,1,3,2,3,2}, REXX = 6X2 = 3,X4 = 2}。 


F oe 


图 7 Bte, BUHAY, =6, RA 7 被 标记 


Fig.7 In the first round, the threshold is x,=6 and only 7 is marked 
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图 8 #—¥, BENY = 3 


Fig.8 In the second round, the threshold value is x,=3 
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49 H=, BAAY, = 2 


Fig.9 In the third round, the threshold value is x,=2 
图 7， 图 8 和 图 9 展示 了 SumThreshold 算法 的 过 程 。 从 算法 角度 考虑 ， 该 算法 的 时 间 
复杂 度 为 0(2)。 为 了 减少 计算 速度 ， 当 阔 值 M 取 1,2,4,8, 16,32,64,128,256... 时 ， 时 间 复 杂 度 
降 至 0(nlogn)。 


4.3 奇异 值 分 解 


奇异 值 分 解 (Singular Value Decomposition, SVD) 是 线性 代数 中 一 种 重要 的 矩阵 分 解 ， 
能 够 提取 信息 ， 简 约 数据 ， 去 除 噪 声 等 ， 可 将 数据 映射 到 低 维 空间 09。SVD 可 分 解 为 


A = UEVT#(20) 


如 公式 (20)，SVD 将 原始 矩阵 4 分 解 为 三 个 矩阵 : U,Z,V 7， 其 中 U,V 是 正 交 算 阵 ，z 是 
对 角 和 矩阵 ， 对 角 线 上 的 元 素 为 奇异 值 。 绝 大 部 分 的 RFI 信号 在 时 域 或 频 域 上 的 振幅 较 大 。 
用 A 代表 接受 的 天 文 信号 ， 将 其 进行 奇异 值 分 解 ， 即 4 = UZV7， 将 Zz 中 最 大 特征 值 置 为 0， 
将 其 逆向 恢复 后 ， 得 到 新 的 矩阵 4， 那 么 原 和 矩阵 4 中 幅 值 较 大 的 信号 RFI) 会 被 抑制 。 

当 RF fa SEHR, Hope: Castro = 0 时 ， 该 算法 效果 最 好 ， 但 该 方法 仅 适 用 于 宽带 
RFI 信号 ， 对 于 遵从 高 斯 分 布 的 REFI 信号 并 不 适用 "5 。 


5 基于 机 器 学 习 的 RF1 抑制 方法 


随 着 机 器 学 习 和 深度 学 习 等 技术 快速 发 展 以 及 天 文 数据 的 急速 增长 , 两 者 的 结合 已 成 必 
然 趋势 ， 通 过 对 大 量 的 数据 进行 学 习 和 训练 后 ， 能 有 效 地 标记 天 文 信号 中 的 RFI， 并 进行 特 
征 提 取 。 


5.1 主 成 分 分 析 法 


主 成 分 分 析 (Principal Component Analysis, PCA) 是 一 种 用 于 数据 特征 降 维 的 方法 ， 
常用 于 减少 数据 集 的 维 数 ， 同 时 保持 数据 集 对 方差 贡献 最 大 的 特征 。 这 样 低 阶 成 分 往往 能 够 
保留 数据 的 重要 信息 ， 方 便 特征 提取 和 分 类 7。 


文献 [19] 对 生活 中 常见 的 九 种 瞬时 RFI 来 源 进行 分 类 测试 实验 , 在 时 域 范围 内 分 别 使 用 
标准 PCA 和 核 PCA 进行 测试 。 之 后 用 一 种 聚 类 分 离 的 方法 比较 了 两 种 方法 的 聚 类 精度 ， 如 


图 10 和 图 11， 发 现 核 PCA 在 区 分 来 源 方面 比 标准 PCA 更 好 ， 能 有 效 区 分 瞬时 RFI 来 源 。 
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图 10 标准 PCA 〈 来 源 文 献 [18] ) 
Fig. 10 Standard PCA 
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图 11 核 PCA《〈 来 源 文献 [18] ) 
Fig. 11 Kernel PCA 
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5.2 支持 向 量 机 
在 机 器 学 习 中 ， 支 持 向 量 机 (Suppo 
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rt Vector Machine, SVM) 是 在 分 类 与 回归 分 析 


中 分 析 数 据 的 监督 式 学 习 模型 与 相关 的 学 习 算 法 P。 
文献 [2H] 选 取 时 间 长 度 为 300us 非 RFI 和 RFI 信号 训练 ， 提 取 均 方 根 、 均 值 、 方 差 、 均 


值 与 方差 之 比 、 偏 度 、 峰 度 、 最 大 振幅 、 最 小 振幅 和 峰值 个 数 等 信息 ， 导 入 SVM 训练 模型 ， 


之 后 对 测试 数据 进行 RFI 和 非 RFI 分 类 ， 


流程 如 图 12 所 示 。 结 果 表 明 即 使 在 非常 低 INR 和 


RFI 占 空 比 小 的 情况 下 ， 该 方法 仍 能 准确 地 检测 出 RFI， 效 果 良 好 。 


Generate the 
一 一 一 | 
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window 
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Feature 
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= selection 
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Extract the Create the 
fertures dataset 


z= 
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图 12 %7 


F SVM 的 RFI 抑制 过 程 


Fig. 12 RFI suppression process based on SVM 


5.3 神经 网 络 


神经 网 络 的 基本 结构 包含 输入 层 、 隐 藏 层 和 输出 层 , 由 大 量 的 节点 和 之 间 相 互 连 接 构 成 ， 
是 一 种 非 线 性 统计 性 数据 建 模 工具 , 常用 来 对 输入 和 输出 间 复杂 的 关系 进行 建 模 , 或 用 来 探 


RAR, 


文献 [23] 提 出 了 全 卷 积 神经 网 络 (Deep Fully Convolutional Neural Network, DFCN, HF 


图 像 的 分 割 ， 解 决 的 核心 问题 是 图 像 像素 


级 别 的 分 类 。 文 献 [24] 利 用 DEFCN， 如 图 13, H Fl 


W 分 别 对 应 输入 的 时 间 和 频率 可 见 性 维 数 ，F 为 滤波 器 层 数 ，L 对 应 输入 和 全 卷 积 层 之 间 的 
层 数 总 和 ， 以 振幅 和 相位 为 特征 ， 瀑 布 图 


Amplitude 


H/2 x W/2 x 2F 


H/4 x W/4 x 4F 


Prediction 


进行 特征 提取 ， 并 标记 出 RFL 


H/2* x W/2'x 2F 
= Th 


O- layer normalization 


O- dropout 


图 13 DFCN 架构 (来 源 文 献 [23]) 
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Fig. 13 DFCN architecture 
文献 [25] 提 出 的 U-Net 神经 网 络 ,是 在 卷 积 神经 网 络 的 基础 上 增加 了 上 卷 积 的 扩展 路 径 ， 
可 以 应 对 小 样本 的 数据 集 进行 较 快 、 有 效 地 图 像 分 割 ， 被 用 于 医学 细胞 图 像 分 割 。 文 献 [3] 
成 功 地 应 用 了 U-Net 深度 神经 网 络 模 型 来 识别 单 天 线 射 电 望 远 镜 数 据 中 的 RFI, 其 结构 如 图 


14。 


Input pixels 


===> Down sampling 
=> Up sampling 
= Feature concatenation 


图 14 U-Net 架构 (来 源 文献 [3]) 


Fig. 14 U-Net architecture 


文献 [26] 发 现 使 用 卷 积 神经 网 络 (Convolutional Neural Networks, CNN) 在 对 FAST 数据 进 


行 标记 RFI 时 ， 常 常 标记 错误 ， 需 要 进一步 人 工 检 查 ， 带 来 了 显著 的 额外 工作 量 ， 为 了 克 
服 这 一 问题 ， 提 出 了 一 种 称 为 RFI-Net 的 神经 网 络 模型 如 图 15 所 示 , 结 果 表 明 ，RFLNet 模 


型 要 优 于 U-Net，KNN(K-nearest Neighbour) 和 SumThreshold 算法 。 

循环 神经 网 络 (Recurrent Neural Network，RNN) 是 一 类 用 于 处 理 序列 数据 的 神经 网 络 ， 
对 处 理 上 下 文 关联 的 语音 "数据 有 很 好 效果 。 天 文 信号 也 是 一 种 时 序数 据 ， 非 常 适 和 使 用 
RNN 对 其 进行 处 理 ，Burd 等 人 利用 RNN 对 射电 望远镜 干涉 阵列 数据 进行 RFI 检测 ， 根 据 


巨 米 波 射 电 望远镜 (Giant Metrewave Radio Telescope, GMRT ) 的 610MHz 的 RFI 振幅 信息 ， 


区 分 RFI ASE RET AES, 
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图 15 RFI-Net 架构 (来源 文献 [25]) 


Fig. 15 RFI-Net architecture 


本 文系 统 曾 述 了 射电 天 文中 抑制 和 标记 REL 算法 和 技术 ， 分 析 了 在 主动 预防 阶段 、 预 
相关 阶段 、 后 相关 阶段 REL 抑制 方法 的 优势 和 不 足 。 采 用 有 效 地 屏蔽 手段 可 以 在 主动 预防 


阶段 阻止 大 部 分 RFI 3 
RFI， 在 后 相关 阶段 大 部 分 外 


和 识别 是 目 


入 系统 ， 预 相关 阶段 基于 各 个 天 线 中 的 天 文 信号 具有 相关 特性 抑制 


AETR REFI。 通 过 机 器 学 习 相 关 技 术 对 RFI 进行 标记 
前 的 研究 热点 ， 基 于 海量 天 文 数据 进行 训练 能 够 极 大 提高 标记 RFI 的 正确 率 ， 


但 不 足 是 前 期 手动 标记 训练 样本 中 RFI 和 天 文 信号 十 分 耗费 时 间 ， 目 前 可 用 的 训练 样本 有 


限 。 
RFI fii 


Bl Pa) sel RESEN BCR & BHT IS PT AR, 从 射电 望远镜 台 址 周边 的 无 线 电 


环境 保护 到 最 终 天 文 数据 处 理 过 程 各 个 环节 都 需要 考虑 RFI 问题 。 各 天 文 台 站 需要 结合 实 
际 需 求 和 所 处 环境 的 电磁 干扰 情况 ， 合 理 选 择 REL 抑制 方法 。 
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Abstract: Aiming at the problem of radio frequency interference (RFI) in the process of 
radio astronomy observation, the RFI mitigation strategies of domestic and foreign stations are 
analyzed in detail. According to the RFI problems encountered in the actual observation process 
of each observatory, the prevention strategies and mitigation methods of RFI were studied from 
the aspects of active prevention stage, pre-correlation stage, post-correlation stage, machine 
learning and deep learning. The methods that can be adopted in the active prevention stage, 
adaptive filtering in the pre-correlation stage, spatial filtering method, VarIhreshold， 
SumThreshold and singular value decomposition in the post correlation stage are systematically 
analyzed. The applications of principal component analysis based on machine learning, support 
vector machine, full convolution neural network, convolution neural network, u-net and other 
related technologies and methods in RFI signal processing are discussed. 


Key words: RFI; filtering; thresholding; machine learning. 


Aiming at the problem of radio frequency interference (RFI) in the process of radio 
astronomy observation, the RFI mitigation strategies of domestic and foreign stations are analyzed 
in detail. According to the RFI problems encountered in the actual observation process of each 
observatory, the prevention strategies and mitagation methods of RFI were studied from the 
aspects of active prevention stage, pre-correlation stage, post-correlation stage, machine learning 
and deep learning. The methods that can be adopted in the active prevention stage, adaptive 
filtering in the pre-correlation stage, spatial filtering method, VarThreshold, SumThreshold and 
singular value decomposition in the post correlation stage are systematically analyzed. The 
applications of principal component analysis based on machine learning, support vector machine, 
full convolution neural network, convolution neural network, u-net and other related technologies 


and methods in RFI signal processing are discussed. 


